The main objective of Prognostics and Health Management is to estimate the Remaining Useful Lifetime (RUL), namely, the time that a system or a piece of equipment is still in working order before starting to function incorrectly. In recent years, numerous machine learning algorithms have been proposed for RUL estimation, mainly focusing on providing more accurate RUL predictions. However, there are many sources of uncertainty in the problem, such as inherent randomness of systems failure, lack of knowledge regarding their future states, and inaccuracy of the underlying predictive models, making it infeasible to predict the RULs precisely. Hence, it is of utmost importance to quantify the uncertainty alongside the RUL predictions. In this work, we investigate the conformal prediction (CP) framework that represents uncertainty by predicting sets of possible values for the target variable (intervals in the case of RUL) instead of making point predictions. Under very mild technical assumptions, CP formally guarantees that the actual value (true RUL) is covered by the predicted set with a degree of certainty that can be prespecified. We study three CP algorithms to conformalize any single-point RUL predictor and turn it into a valid interval predictor. Finally, we conformalize two single-point RUL predictors, deep convolutional neural networks and gradient boosting, and illustrate their performance on the Commercial Modular Aero-Propulsion System Simulation (C-MAPSS) data sets.
translated by 谷歌翻译
We study the algorithm configuration (AC) problem, in which one seeks to find an optimal parameter configuration of a given target algorithm in an automated way. Recently, there has been significant progress in designing AC approaches that satisfy strong theoretical guarantees. However, a significant gap still remains between the practical performance of these approaches and state-of-the-art heuristic methods. To this end, we introduce AC-Band, a general approach for the AC problem based on multi-armed bandits that provides theoretical guarantees while exhibiting strong practical performance. We show that AC-Band requires significantly less computation time than other AC approaches providing theoretical guarantees while still yielding high-quality configurations.
translated by 谷歌翻译
这本简短的说明是对有条件熵和相互信息的量化和认知不确定性的量化的批判性讨论,这是最近在机器学习中提出的,从那时起就已经变得很普遍。更普遍地,我们质疑将完全不确定性加入到其核心和认知成分中的想法。
translated by 谷歌翻译
到目前为止,可解释的人工智能(XAI)主要集中在静态学习方案上。我们对逐步采样数据的动态场景感兴趣,学习是以增量而不是批处理模式进行的。我们寻求有效的增量算法来计算特征重要性(FI)度量,具体来说,基于缺乏特征的特征边缘化的增量FI度量,类似于置换功能的特征重要性(PFI)。我们提出了一种称为IPFI的高效,模型不足的算法,以逐步估算此度量,并在包括概念漂移(概念漂移)在内的动态建模条件下进行估算。我们证明了关于期望和差异方面的近似质量的理论保证。为了验证我们的理论发现和与传统批处理PFI相比,我们的方法的疗效,我们对具有和没有概念漂移的基准数据进行了多项实验研究。
translated by 谷歌翻译
神经崩溃的概念是指在各种规范分类问题中经验观察到的几种新兴现象。在训练深度神经网络的终端阶段,同一类的所有示例的特征嵌入往往会崩溃为单一表示,而不同类别的特征往往会尽可能分开。通常通过简化的模型(称为无约束的特征表示)来研究神经崩溃,其中假定模型具有“无限表达性”,并且可以将每个数据点映射到任何任意表示。在这项工作中,我们提出了不受约束的功能表示的更现实的变体,该变体考虑到了网络的有限表达性。经验证据表明,嘈杂数据点的记忆导致神经崩溃的降解(扩张)。使用记忆 - 稀释(M-D)现象的模型,我们展示了一种机制,通过该机制,不同的损失导致嘈杂数据上受过训练的网络的不同性能。我们的证据揭示了为什么标签平滑性(经验观察到产生正则化效果的跨凝性的修改)导致分类任务的概括改善的原因。
translated by 谷歌翻译
算法配置(AC)与对参数化算法最合适的参数配置的自动搜索有关。目前,文献中提出了各种各样的交流问题变体和方法。现有评论没有考虑到AC问题的所有衍生物,也没有提供完整的分类计划。为此,我们引入分类法以分别描述配置方法的交流问题和特征。我们回顾了分类法的镜头中现有的AC文献,概述相关的配置方法的设计选择,对比方法和问题变体相互对立,并描述行业中的AC状态。最后,我们的评论为研究人员和从业人员提供了AC领域的未来研究方向。
translated by 谷歌翻译
最近的机器学习(ML)的应用揭示了从其用于预测建模的使用者在数据驱动的模型的施工意义上揭示了主要用于预测(地面真实事实)以便使用规范建模的目的。这是什么意思是学习一个模型的任务,该模型规定了关于现实情景的正确行动方案的适当决定:应该应用哪种医疗治疗?这个人应该被雇用吗?如本文所说,规范性建模具有新的技术条件,用于学习和新的可靠性,责任和决策伦理的要求。因此,为了支持采用理性但同时承担负责任的决策代理的数据驱动设计,需要一种规范性ML的严格方法。本简要论文的目的是详细阐述规范ML的特定特征,并强调它所暗示的一些关键挑战。此外,提出了与当代AI研究的其他分支的连接,提倡在(广义)决策 - 理论框架中的规定毫升的接地。
translated by 谷歌翻译
自动化机器学习(Automl)努力自动配置机器学习算法及其组合的整体(软件)解决方案 - 机器学习管道 - 针对手头的学习任务(数据集)量身定制。在过去十年中,Automl已成为具有数百个贡献的热门研究课题。虽然Automl提供了许多前景,但也称它也是相当资源密集的,这是其主要批评的主要观点之一。高资源消耗的主要原因是许多方法依赖于许多ML管道的(昂贵)评估,同时寻找良好的候选者。由于使用许多数据集和方法进行了大规模实验,因此在Automl方法研究的背景下放大了这个问题,每个数据都是用几种重复来排除随机效应的几个重复的实验。本文阐述了最近的绿色AI的精神,是为了提高对问题的自动化研究人员的意识,并详细阐述可能的补救措施。为此,我们确定了四类行动,社区可能采取更加可持续的自动化计划,即接近设计,基准,研究激励和透明度。
translated by 谷歌翻译
区分和量化两种重要类型的不确定性,通常被称为炼狂和认识的想法,在过去几年里,在机器学习研究中受到了越来越关注。在本文中,我们考虑基于合并的不确定量化方法。区分不同类型的不确定感知学习算法,我们专注于基于所谓的信件集的贝叶斯方法和方法,这自然而然地从集合学习的角度来看。对于这两种方法,我们解决了如何量化炼体和认识性不确定性的问题。评估了相应措施的有效性,并在对拒绝选项进行分类的实证研究中进行了比较。
translated by 谷歌翻译
自我培训是半监督学习的有效方法。关键的想法是让学习者本身根据其当前假设而迭代地为未标记的实例生成“伪监督”。结合一致性正则化,伪标签在各个域中显示了有希望的性能,例如在计算机视觉中。为了考虑伪标签的假设性质,这些通常以概率分布的形式提供。仍然可能争辩说,即使是概率分布也代表过多的知情程度,因为它表明学习者精确地了解地面真理的条件概率。在我们的方法中,我们因此允许学习者以债务集的形式标记实例,即(候选人)概率分布。由于这种表现力增加,学习者能够以更加灵活和更忠诚的方式代表不确定性和缺乏知识。要从那种弱标记的数据中学习,我们利用最近在所谓的超集学习领域提出的方法。在详尽的经验评估中,我们将我们的方法与最先进的自我监督方法进行比较,表明竞争优越的性能,尤其是含有高度不确定性的低标签情景。
translated by 谷歌翻译